Extraction bilingue de termes médicaux dans un corpus parallèle anglais/français
نویسندگان
چکیده
Résumé. Le Catalogue et Index des Sites Médicaux Francophones (CISMeF) recense les principales ressources institutionnelles de santé en français. La description de ces ressources, puis leur accès par les utilisateurs, se fait grâce à la terminologie CISMeF, fondée sur le thésaurus américain Medical Subject Headings (MeSH). La version française du MeSH comprend tous les descripteurs MeSH, mais de nombreux synonymes américains restent à traduire. Afin d’enrichir la terminologie, nous proposons ici une méthode de traduction automatique de ces synonymes. Pour ce faire, nous avons constitué deux corpus parallèles anglais/français du domaine médical. Après alignement semi-automatique des corpus paragraphe à paragraphe, nous avons procédé automatiquement à l’appariement bilingue des termes. Pour cela, le lexique constitué des descripteurs MeSH américains et de leur traduction en français a fourni les couples amorces qui ont servi de point de départ à la propagation syntaxique des liens d’appariement. 217 synonymes ont pu être traduits, avec une précision de 70%.
منابع مشابه
Les Triggers Inter-langues pour la Traduction Automatique Statistique. (Inter-lingual Triggers for Statistical Machine Translation)
Dans cet article, nous décrivons le concept de triggers inter-langues. Nous expliquons ensuite comment nous avons utilisé de tels triggers pour construire automatiquement un dictionnaire bilingue. Nous avons par la suite évalué notre dictionnaire bilingue en le comparant à deux dictionnaires existants, le premier fourni par ELRA et le second en libre accès sur Internet. Cependant, afin de rendr...
متن کاملExtraction multilingue de termes à partir de leur structure morphologique
Les mØthodes d’extraction automatique de termes utilisent couramment des patrons dØcrivant la structure des termes (Ibekwe-Sanjuan et Sanjuan, 2004; Enguehard, 1992; Vergne, 2005). Dans les domaines scienti ques ou techniques comme la mØdecine (Namer, 2005), de nombreux termes appartiennent au vocabulaire savant et sont construits à partir de formants classiques grecs ou latins situØs en dØbut ...
متن کاملIdentification, Alignment, and Tranlsation of Relational Adjectives from Comparable Corpora (Identification, alignement, et traductions des adjectifs relationnels en corpus comparables) [in French]
RÉSUMÉ Dans cet article, nous extrayons des adjectifs relationnels français et nous les alignons automatiquement avec les noms dont ils sont dérivés en utilisant un corpus monolingue. Les alignements adjectif-nom seront ensuite utilisés dans la traduction compositionelle des termes complexes de la forme [N AdjR] à partir d’un corpus comparable français-anglais. Un nouveau terme [N N�] (ex. canc...
متن کاملExtraction of temporal relations between clinical events in clinical documents (Extraction des relations temporelles entre événements médicaux dans des comptes rendus hospitaliers) [in French]
RÉSUMÉ Le défi i2b2/VA 2012 était dédié à la détection de relations temporelles entre événements et expressions temporelles dans des comptes rendus hospitaliers en anglais. Les situations considérées étaient beaucoup plus variées que dans les défis TempEval. Nous avons donc axé notre travail sur un examen systématique de 57 situations différentes et de leur importance dans le corpus d’apprentis...
متن کاملConstitution d'une Base Bilingue de Marqueurs de Relations Conceptuelles pour l'Élaboration de Ressources Termino-Ontologiques
Les marqueurs de relations conceptuelles sont un moyen efficace de détecter des contextes utiles à l’élaboration de ressources termino-ontologiques. De nombreux travaux existent, mais aucun recensement n’a été effectué. Nous souhaitons construire une base de marqueurs de relation pour l’hyperonymie, la méronymie et la cause, en français et en anglais. La prise en compte de la variation dans l’a...
متن کامل